'''
给定一段包含手机号码的文本，要求对其进行处理，以给手机号码打上马赛克效果，隐藏其中的部
分数字。

import re

pattern =r"1([3-9]\d)\d{8}"

print(re.sub(pattern,r"\1********",content))
'''
from _ast import pattern

'''
给定一个包含多种日期格式的字符串，要求将其中的日期格式统一转换为YYYY-MM-DD的形式。

import re

content = "2021/05/26,2021.05.26,05-25-2021"
re.sub(r"(\d{4})/(\d{2})/(\d{2})",r"\1-\2-\3",content)
re.sub(r"(\d{4}).(\d{2}).(\d{2})",r"\1-\2-\3",content)
re.sub(r"(\d{2})-(\d{2})-(\d{4})",r"\3-\1-\2",content)
'''

'''
从BeginnerGuideToPython.txt文件中提取单词并统计词频，打印频率最高的前20个单词及其出现
次数。

import re
import pandas as pd
with open('BeginnerGuideToPython.txt','r',encoding='utf-8') as f:
    content = f.read()

re.split(r"[\s?.;,()/]+",content)
word_series = pd.Series(content)
top_20 = word_series.value_counts()[:20]
print(top_20)
'''

'''
对一段中文文本进行分词操作，并去除文本中的标点符号和空格。

import re
import jieba


re.sub(r"[\s!，。、]","",content)

word_list = jieba.cut(content)
print(word_list)
'''